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Abstract Of DE 10159283 (A1) 

Arrangement comprises a processor for parallel data > * * '* 1 5 < «• < 

processing that is divided into a number of parallel 5 ! 
strips (1) each comprising a processing unit (2), a 

part of a memory assembly (5) and an address ; , I ) i i ( 

generation unit (AGU) (6). A local AGU (LAGU) (4) \ ' 

is assigned to each processor strip that is connected 1 t & 

to the AGU on one side and the strip address ; ' 

memory on the other side. An Independent claim is * ' 1 

made for a method for address generation of a strip 
designed processor in which address generation is 
carried out in a strip specific manner. 
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i) Verfahren und Anordnung zur Adressgenerierung in einem Prozessor 

) Der Erfindung, die eine Anordnung, bestehend aus ei- 
nem Prozessor zur parallelen Datenverarbeitung, der in 
mehrere parallel zueinander angeordnete Streifen einge- 
teilt ist, die jeweils eine Verarbeitungseinheit, einen Teil 
einer Speicherbaugruppe und eine Adressgenerierungs- 
einheit beinhalten und ein Verfahren zur Adressgenerie- 
rung in einem derartigen Prozessor betrifft, bei dem eine 
globale Adresse generiert wird, mittels derer ein Speicher 
adressierbar ist, liegt die Aufgabe zugrunde, einen von- 
einander unabhangigen Datenzugriff einzelner Verarbei- 
tungseinheiten auf die zugehorigen Elemente in einem 
gemeinsamen Gruppenspeicher zu realisieren. Dies wird 
anordnungsseitig dadurch gelost, dass fur mindestens ei- 
nen der Streifen eine lokale Adressgenerierungseinheit 
(LAGU) angeordnet ist, die einerseits mit der AGU und 
andererseits mit einem Streifenadressspeicher verbun- 
den ist und dass der Streifenadressspeicher aus einem 
dem Streifen zugeordneten Index-Register besteht. Die 
verfahrensseitige Losung besteht darin, dass die Adress- 
generierung streifenspezifisch erfolgt, wobei in einem 
Streifenadressspeicher streifenspezifische Werte gespei- 
chert werden und die globale Adresse mit dem streifen- 
spezifischen Wert aus dem Streifenadressspeicher zur 
streifenspezifischen Adresse verarbeitet wird. 
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Beschreibung 

[0001] Die Erfindung betrifft eine Anordnung bestehend 
aus einem Prozessor zur parallelen Datenverarbeitung, der 
in mehrere parallel zueinander angeordnete Streifen einge- 
teilt ist, die jeweils eine Verarbeitungseinheit und einen Teil 
einer Speicherbaugruppe beinhalten und einer Adressgene- 
rierungseinheit (AGU = Address-Generation-Unit). 
[0002] Die Erfindung betrifft auch ein Verfahren zur 
Adressgenerierung in einem streifenweise aufgebauten Pro- 
zessor zur parallelen Datenverarbeitung bei dem eine glo- 
bale Adresse generiert wird mittels derer ein Speicher adres- 
sierbar ist. 

[0003] Aus der DE 198 35 216 Al ist eine Prozessoran- 
ordnungen zur parallelen Datenverarbeitung bekannt, bei 
der mehrere Streifen parallel zueinander angeordnet sind. 
Jeder dieser Streifen besitzt eine eigene Datenverarbeitungs- 
einheit sowie einen zugeordneten Speicherstreifen, der ein 
Teil des Gruppenspeichers ist. In einem Steuerwerk ist nor- 
malerweise eine AGU angeordnet, die eine globale Adresse, 
welche iiblicberweise auch als Basisadresse bezeichnet 
wird, fur alle Datenspeicherstreifen generiert. 
[0004] Soil beispielsweise ein Datum aus einem zugeord- 
neten Speicherstreifen in das Eingangsregister der Verarbei- 
tungseinheit ubernommen werden, erzeugt die AGU die ent- 
sprechende globale Speicheradresse. Diese Speicheradresse 
ist ein Zeiger auf eine Datengruppe mit mehrercn Elementen 
im Gmppenspeicher. Jedem dieser Elemente ist eine Verar- 
beitungseinheit zugeordnet in die die Daten ubernommen 
werden. Die Adresse steht fur alle Streifen gleichzeitig zur 
Verfiigung, dass heiBt auch fur diejenigen, die andere Werte 
ubernehmen sollen. 

[0005] Damit mussen von der AGU fur alle notwendigen 
Streifen nacheinander die Adressen der entsprechenden Da- 
tengruppen generiert werden, aus denen die Elemente fiir 
die Verarbeitungseinheiten ubernommen werden. Der glei- 
che Aufwand kann auch bei Schreiboperationen in den 
Gruppenspeicher notwendig sein. 

[0006] Diese Adressgenerierung durch die AGU erfolgt 
nacheinander und bewirkt damit eine auf mehrere Prozes- 

rtaktc sil langsarac * tatbeitung. 
[0007] Der Erfindung liegt die Aufgabe zugrunde, einen 
voneinander unabhangigen Datenzugriff einzetner in den 
Streifen eines Prozessors zur parallelen Datenverarbeitung 
angeordneter Verarbeitungseinheiten auf die zugehorigen 
Elemente in einer Speicherbaugruppe zu realisieren. 
[0008] GemaB der Erfindung wird die Aufgabe anord- 
nungsseitig dadurch gelost, dass fiir mindestens einen der 
Streifen eine lokale Adressgenerierungseinheit (LAGU) an- 
geordnet ist, die einerseits mit der AGU und andererseits mit 
einem Streifenadressspeicher verbunden ist. 
[0009] Die Aufgabe der lokalen Adressgenerierungsein- 
heit besteht in der Erzeugung einer streifenspezifischen 
Adresse. Diese Adresse ist die Grundlage fur die Uber- 
nahme streifenspezifischer Elemente aus einem zugeordne- 
ten RAM-Speicherbereich und damit fiir die Moglichkeit 
der parallelen Datenubernahme von Elementen die nicht un- 
ter einer globalen Adresse (Datengruppe) im Speicher abge- 
legt sind und in die Verarbeitungseinheiten ubernommen 
werden mussen. Die Basis fiir die streifenspezifische 
Adresse ist die globale Adresse der AGU (Basisadresse), die 
mit einem Wert aus dem Streifenadressspeicher (Offset) ver- 
kniipft wird. 

[0010] In einer giinstigen Ausfiihrung der Erfindung ist 
vorgesehen, dass der Streifenadressspeicher aus einem dem 
Streifen zugeordneten Index-Register besteht. 
[0011] Der zur Bildung der streifenspezifischen Adresse 
auf Grundlage der globalen Adresse der AGU notwendige 
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Wert wird in einem Index-Register, welches dem Streifen 
logisch zugeordnet ist, gespeichert. Der Inhalt des Registers 
kann aufgabenspezifisch geandert werden, er kann bei- 
spielsweise das Ergebnis einer Operation der Verarbeitungs- 
5 einheit selbst sein. Es konnen auch mehrere Index-Register 
zur Verfiigung stehen. 

[0012] In einer weiteren giinstigen Ausfiihrung der Erfin- 
dung ist vorgesehen, dass das Index-Register lokal im Strei- 
fen-Layout angeordnet ist. 

to [0013] Diese Anordnung wird gewahlt, um das Schal- 
tungs-Layout entsprechend logisch zu strukturieren. 
[0014] In einer weiteren Ausgestaltung der Erfindung ist 
vorgesehen, (lass die Speicherbaugruppe ganz oder tcilwcisc 
durch cinzelnc RAM-Speicher mit inlegriertem Adressde- 

15 coder, die den Streifen zugeordnet sind, aufgebaut ist. 
[0015] Da mit Hilfe der lokalen Adressgenerierungsein- 
heit (LAGU) eine streifenspezifische Adresse erzeugt wird, 
muss die Adressdecodierung fiir jeden Streifen individuell 
durchgefiihrt werden. Dies fiihrt zur Aufteilung der Spei- 

20 cherbaugruppe in einzelne, den Streifen zugeordnete RAM- 
Speicher mit integriertem Adressdecoder. Wird die gesamte 
Speicherbaugruppe in einzelne RAM-Speicher mit inte- 
griertem Adressdecoder eingeteilt, kann das Prinzip der 
streifenspezifischen Adressgenerierung iiber den gesamten 

25 zum Streifen gehorigen Speicheradressbereich angewendet 
werden. Fiir viele Anwendungen ist es ausreichend, nur ei- 
nen bestimmten Adressbereich der Speicherbaugruppe nach 
diesem Prinzip aufzubauen. In diesem Fall wird im verblei- 
benden Teil der Speicherbaugruppe die Auswahl der Daten- 

30 gruppen, wie im Stand der Technik iiblich, durch einen zen- 
tralen Adressdecoder, an dem die globale Adresse der AGU 
anliegt, durchgefiihrt. Diese Variante reduziert den Aufwand 
bei der Implementierung der Adressdecoder in den einzel- 
nen Streifen. 

35 [0016] In einer weiteren Ausgestaltungsform der Erfin- 
dung ist vorgesehen, dass die Anzahl der Adressleitungen 
eines Index-Register kleiner als die Anzahl der Adresslei- 
tungen der AGU ist. 

[0017] Ist nur in einem Teil der Speicherbaugruppe eine 

40 streifenspezifische Adressgenerierung vorgesehen, ergibt 
sich eine Rcduzierung der Anzahl der Adressleitungen des 
Index-Register logischerweise auf die zur Adressierung, des 
erfindungsgemaBen Teil des Speicherbereichs notwendige 
Anzahl der Leitungen. Unabhangig davon kann die Anzahl 

45 der Adressleitungen auf das zur Losung der jeweiligen Auf- 
gabe notwendige MaB weiter reduziert werden. Damit kann 
nicht der gesamte zur Verfiigung stehende Adressbereich 
durch das Index-Register abgedeckt werden sondern nur ein 
Adressbereich der je nach Verfahren zur Ermittlung der 

50 streifenspezifischen Adresse, relativ zur globalen Adresse 
der AGU angeordnet ist. Mit der Reduzierung der Adresslei- 
tungen bzw. der Bitstellen des Index-Register reduziert sich 
der Aufwand bei der Implementierung. 
[0018] In einer weiteren giinstigen Ausfiihrung der Erfin- 

55 dung ist vorgesehen, dass der Prozessor zur parallelen Da- 
tenverarbeitung ein STMD- oder ein Superscalar- Prozessor 

[0019] GemaB der Erfindung wird die Aufgabe verfah- 
rensseitig dadurch gelost, dass die Adressgenerierung strei- 

60 fenspezifisch erfolgt. 

[0020] Um einen voneinander unabhangigen Datenzugriff 
einzelner Verarbeitungseinheiten auf die Speicherbaugruppe 
zu realisieren, muss fiir jeden Streifen eine spezifische Strei- 
fenadresse generiert werden. 
65 [0021] In einer giinstigen Ausfiihrung des Verfahrens ist 
vorgesehen, dass in einem Streifenadressspeicher streifen- 
spezifische Werte gespeichert werden und dass die globale 
\dresse mit den streifenspezifischen Wert jus dem Strei- 
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fenadressspeicher zur streifenspezifischen Adresse verarbei- 
tet wird. 

[0022] Der im Streifenadressspeicher abgelegte Wert kann 
aufgabenspezifisch gesetzt werden oder ist das Ergebnis ei- 
ner vorangegangenen Operation der Verarbeitungseinheit. 5 
Dieser Wert kann beispielsweise zu der von der AGU gene- 
rierten globalen Adresse addiert werden. Das Ergebnis ist 
die streifenspezifische Adresse eines Streifens. Jeder fur die- 
ses Verfahren vorgesehene Streifen verfflgt iiber die zur Ge- 
nerierung der streifenspezifischen Adresse notwendige Ver- to 
arbeitungseinheit (LAGU) und mindestens einen Streifen- 
adressspeicher (Index-Register). Damit kann die Adressbe- 
rechnung in den Streifen parallel und unabhiingig voneinan- 
dcr crfolgcn. Die Ubcrnahme der Daten aus der Speicher- 
baugruppe in die zugeordneten Verarbeitungseinheiten wird 15 
in einem der Adressberechnung nachfolgendem Zyklus fiir 
alle Verarbeitungseinheiten gleichzeitig durchgefiihrt. 
[0023] In einer weiteren gunstigen Ausfiihrung des Ver- 
fahrens ist vorgesehen, dass die streifenspezifischen Werte 
lokal im Streifen gespeichert sind. 20 
[0024] Um das Schaltungslayout logisch und entspre- 
chend physisch zu strukturieren, wird das Register zur Spei- 
cherung des streifenspezifischen Werts lokal im Streifen an- 
geordnet. 

[0025] In einer gunstigen Ausfiihrungsform des Verfah- 25 
rens ist vorgesehen, dass die Verarbeitung durch Addition 
oder Subtraktion der globalen Adresse mit dem streifenspe- 
zifischen Wert oder durch Substitution von Teilwerten der 
globalen Adresse mit dem streifenspezifischen Wert oder 
durch Verschieben um eine mit dem streifenspezifischen 30 
Wert festgelegten Richtung und GroBe oder dass die Verar- 
beitung durch eine Kombination zweier oder mehrerer die- 
ser Verarbeitungsarten erfolgt. 

[0026] Die Generierung der streifenspezifischen Adresse 
erfolgt beispielsweise, indem zur globalen Adresse der strei- 35 
fenspezifische Wert des Index-Register addiert wird. Eine 
andere Moglichkeit ist das Ersetzen des niederwertigen 
Teils der globalen Adresse durch den streifenspezifischen 
Wert (Substitution). Eine weitere Moglichkeit besteht in der 
Kombination der Verarbeitungsarten. Beispielsweise wird in 40 
einem ersten Schritt die globale Adresse um vier Stellen 
nach links verschoben und anschlieBend erfolgt in einem 
zweiten Schritt die Substitution der vier niederwertigsten 
Bitstellen mit dem streifenspezifischen Wert. 
[0027] Die Erfindung soli nachfolgend anhand eines Aus- 45 
fiihrungsbeispiels naher erlautert werden. In der zugehori- 
gen Zeichnung ist eine prinzipielle Schaltungsanordnung 
zur streifenspezifischen Adressgenerierung dargestellt. 
[0028] In der Anordnung sind auszugsweise zwei Streifen 
1 eines Prozessors zur parallelen Datenverarbeitung darge- 50 
stellt. In jedem Streifen 1 ist eine Verarbeitungseinheit 2, 
mindestens ein Index-Register 3, eine lokale Adressgenerie- 
rungseinheit (LAGU) 4 und eine RAM-Speicherbaugruppe 
mit integriertem Adressdecoder 5 angeordnet. Der RAM- 
Speicher 5 ist in Elemente 7 eingeteilt. Die Verarbeitungs- 55 
einheit 2 ist mit dem RAM-Speicher 5 durch einen Datenbus 
8 verbunden. Neben den Streifen 1 ist die Adressgenerie- 
rungseinheit (AGU) 6, die Teil des hier nicht naher darge- 
stellten Steuerwerks ist, dargestellt. 

[0029] Im Beispiel soil eine parallele Quantisierung von 60 
Werten iiber Look-Up-Tables durchgefuhrt werden. Dazu ist 
in den RAM-Speicherbaugruppen 5 jeweils eine Look-Up- 
Table ab einer festgelegten Basisadresse hinterlegt. Der 
Wert des jeweiligen Index-Registers 3 wird durch eine vor- 
angegangene Operation der zugehorigen Verarbeitungsein- 65 
heit 2 erzeugt. 

[0030] Zum Auslesen eines Elements 7 aus einer der Ver- 
arbeitungseinheit 2 zugeordneten RAM-Spcicherbaugruppc 
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5 erzeugt die AGU 6 eine globale Adresse 9, die an alien 
Streifen 1 des Prozessors anliegt. In diesem Fall ist das ein 
Zeiger auf den Anfang der Look-Up-Table. Mit dem Wert 
des Index-Registers 3 und der globalen Adresse 9 der AGU 

6 wird in der LAGU 4 durch Addition beider Adressen die 
streifenspezifische Adresse 10 erzeugt, mit deren Hilfe das 
entsprechende Element 7 aus der Look-Up-Table ausge- 
wahlt und iiber den Datenbus 8 in die Verarbeitungseinheit 2 
ubernommen wird. In den benachbarten Streifen 1 wird die 
(jenerierung der streifenspezifischen Adresse 10 mit den 
entsprechenden Index-Register-Inhalten analog dazu durch- 
gefuhrt. Damit kann die Ubernahme der verschiedenen Ele- 
mente 7 aus den Look-Up-Tables in die Verarbeitungsein- 
heiten 2 iiber den Datenbus 8 in einem der Adressgenerie- 
rung folgenden Lesezyklus erfolgen. 

Bezugszeichenliste 

1 Streifen 

2 Verarbeitungseinheit 

3 Index-Register 

4 lokale Adressgenerierungseinheit (LAGU) 

5 RAM-Speicherbaugruppe mit Adressdecoder 

6 Adressgenerierungseinheit (AGU) 

7 Element 

8 Datenbus 

9 globale Adresse 

10 streifenspezifische Adresse 

Patentanspruche 

1. Anordnung bestehend aus einem Prozessor zur par- 
allelen Datenverarbeitung, der in mehrere parallel zu- 
einander angeordnete Streifen (1) eingeteilt ist, die je- 
weils eine Verarbeitungseinheit (2) und einen Teil einer 
Speicherbaugruppe (5) beinhalten und einer Adressge- 
nerierungseinheit (AGU) (6), dadurch gekennzeich- 
net, dass fur mindestens einen der Streifen (1) eine lo- 
kale Adressgenerierungseinheit (LAGU) (4) angeord- 
net ist, die einerseits mit der Adressgenerierungseinheit 
(AGU) und andererseits mit einem Streifenadressspei- 
cher verbunden ist. 

2. Anordnung nach Anspruch 1, dadurch gekennzeich- 
net, dass der Streifenadressspeicher aus einem dem 
Streifen (1) zugeordneten Index-Register (3) besteht. 

3. Anordnung nach Anspruch 1 und 2, dadurch ge- 
kennzeichnet, dass das Index-Register (3) lokal im 
Streifen-Layout angeordnet ist. 

4. Anordnung nach einem der Anspriiche 1 bis 3, da- 
durch gekennzeichnet, dass die Speicherbaugruppe 
ganz oder teilweise durch einzelne RAM-Speicher mit 
integriertem Adressdecoder (5), die den Streifen (1) 
zugeordnet sind, aufgebaut ist. 

5. Anordnung nach einem der Anspriiche 1 bis 4, da- 
durch gekennzeichnet, dass die Anzahl der Adresslei- 
tungen eines Index-Register (3) kleiner als die Anzahl 
der Adressleitungen der AGU (6) ist. 

6. Anordnung nach einem der Anspriiche 1 bis 5, da- 
durch gekennzeichnet, dass der Prozessor zur paralle- 
len Datenverarbeitung ein SIMD- oder Superscalar- 
Prozessor ist. 

7. verfahren zur Adressgenerierung in einem streifen- 
weise aufgebauten Prozessor zur parallelen Datenver- 
arbeitung bei dem eine globale Adresse generiert wird 
mittels derer ein Speicher adressierbar ist, dadurch ge- 
kennzeichnet, dass die Adressgenerierung streifenspe- 
zifisch erfolgt. 

8. Verfahren nach Anspruch 7, dadurch gekennzeich- 
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net, dass in einem Streifenadressspeicher streifenspezi- 
fische Werte gespeichert werden und dass die globale 
Adresse mit dem streifenspezifischen Wert aus dem 
Streifenadressspeicher zur streifenspezifischen 
Adresse verarbeitet wird. 5 

9. Verfahren nach Anspruch 8, dadurch gekennzeich- 
net, dass die streifenspezifischen Werte lokal im Strei- 
fen gespeichert sind. 

10. Verfahren nach Anspruch 8 oder 9, dadurch ge- 
kennzeichnet, dass die Verarbeitung durch Addition 10 
oder Subtraktion der globalen Adresse mit dem strei- 
fenspezifischen Wert oder durch Substitution von Wer- 
ten der globalen Adresse mit dem streifenspezifischen 
Wert oder durch Verse] 'hi ui cine mit ieiri streifen- 
spezifischen Wert festgelegte Richtung und GroBe oder 15 
dass die Verarbeitung durch eine Kombination zweier 
oder mehrerer dieser Verarbeitungsarten erfolgt. 
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